🌸 Bioestadística Aplicada
Clase 2 de 2 · Unidad 4

Distribución
Ji-Cuadrada (χ²)

Pruebas de independencia entre factores y bondad de ajuste:
el estadístico χ² y sus aplicaciones

χ² Tema 4.6 — Dist. Ji-Cuadrada 🔗 Independencia de factores ✅ Bondad de ajuste

Nivel Principiante  |  Bioestadística Aplicada

🌄
Slide 02 · Introducción
¿Qué es la distribución Ji-Cuadrada?
Contexto
En capítulos anteriores probamos hipótesis sobre medias y proporciones usando distribuciones normal y t de Student. Ahora exploramos dos nuevas distribuciones: Ji-Cuadrada (χ²) y F, que permiten probar hipótesis sobre independencia entre variables y distribuciones de frecuencias.
¿Para qué se usa χ²?
  • ¿Son dos variables independientes entre sí?
  • ¿Una muestra sigue una distribución específica? (Bondad de ajuste)
  • Siempre con datos de conteos/frecuencias
Características de la distribución χ²
📈
Solo valores positivos
A diferencia de la normal, χ² solo toma valores ≥ 0. La curva empieza en 0 y tiene cola larga hacia la derecha (asimétrica positiva).
🔢
Grados de libertad (df)
Hay una familia de distribuciones χ², cada una definida por su número de grados de libertad (df). A mayor df, la curva se aplana y se desplaza a la derecha.
➡️
Prueba unilateral derecha
La prueba χ² siempre es de cola derecha: rechazamos H₀ cuando el estadístico es muy grande (desviación grande entre observado y esperado).
🎯
Slide 03 · Objetivos
¿Qué aprenderás en esta clase?
1
Identificar las características de la distribución Ji-Cuadrada: forma asimétrica, valores positivos, familia de distribuciones por df.
2
Construir tablas de contingencia y calcular frecuencias esperadas bajo el supuesto de independencia entre dos factores.
3
Aplicar la prueba χ² de independencia en 5 pasos, determinando el valor crítico, la región de rechazo y la decisión estadística.
4
Aplicar la prueba de bondad de ajuste χ² para verificar si una muestra sigue una distribución teórica dada.
Tema de esta sesión
4.6 Distribución Ji-Cuadrada — Prueba de independencia · Bondad de ajuste · Grados de libertad · Tabla χ²
📋
Slide 04 · Tema 4.6
Tablas de Contingencia y Frecuencias Esperadas
¿Qué es una tabla de contingencia?
Organiza los conteos observados de dos factores simultáneamente. El Factor 1 define las filas y el Factor 2 define las columnas. Si el Factor 1 tiene I niveles y el Factor 2 tiene J niveles, resulta una tabla I × J.
Frecuencia Esperada (E)
E = (R × C) / n R = total fila · C = total columna · n = muestra total
Intuición
Si los factores son independientes, la probabilidad conjunta es el producto de las probabilidades marginales. La frecuencia esperada es lo que deberíamos ver si no hay relación entre las variables.
Ejemplo: Género y Frecuencia Cardíaca
Contexto
Se estudia si el género del bebé se relaciona con su frecuencia cardíaca. n = 40 bebés. Punto de corte: 145 lpm.
FC Baja (<145)FC Alta (≥145)Total fila
Niña
O = 11
E = 12.6
O = 7
E = 5.4
R = 18
Niño
O = 17
E = 15.4
O = 5
E = 6.6
R = 22
Total col.C = 28C = 12n = 40
Cálculo E (ejemplo)
Niña + FC Baja: E = (18 × 28) / 40 = 12.6
Niña + FC Alta: E = (18 × 12) / 40 = 5.4
χ²
Slide 05 · Tema 4.6
El Estadístico χ² y los Grados de Libertad
Estadístico de prueba
χ² = Σ (O − E)² / E suma sobre todas las celdas de la tabla
Interpretación
Mide qué tan diferentes son los valores Observados (O) de los Esperados (E). Si son muy parecidos → χ² pequeño → no rechazamos H₀ (independencia). Si difieren mucho → χ² grande → rechazamos H₀.
Grados de libertad
Prueba de Independencia (I×J)
df = (I − 1) × (J − 1) I = niveles Factor 1 · J = niveles Factor 2
Bondad de ajuste (I categorías)
df = I − 1 I = número de categorías de la variable
Condición de aplicabilidad
⚠️ Requisito importante
La frecuencia esperada (E) de cada celda debe ser ≥ 5 para que la distribución χ² sea una buena aproximación. Si no se cumple, se deben agrupar categorías o usar otro método.
Ejemplo resuelto: Género y FC
χ² = (11−12.6)²/12.6 + (7−5.4)²/5.4 + (17−15.4)²/15.4 + (5−6.6)²/6.6

= 0.203 + 0.474 + 0.166 + 0.388 = χ² = 1.231

df = (2−1)×(2−1) = 1
Valor crítico α=0.10: χ²₀.₁₀ = 2.706

Como 1.231 < 2.706 → No rechazar H₀
Conclusión: no hay evidencia de relación entre género y FC.
📋
Slide 06 · Tema 4.6
Procedimiento en 5 Pasos: Prueba de Independencia
01
Plantear hipótesis
H₀: Los dos factores son independientes (no hay relación).
Ha: Los dos factores NO son independientes (sí hay relación). Las hipótesis se expresan en palabras, no en símbolos matemáticos.
02
Identificar la distribución y condiciones
Se usa la distribución χ². Verificar que cada E ≥ 5. Calcular df = (I−1)×(J−1). Establecer el nivel de significancia α.
03
Calcular el estadístico de prueba
Construir la tabla de contingencia → calcular E = (R×C)/n para cada celda → calcular χ² = Σ(O−E)²/E sumando todas las celdas.
04
Definir la región de rechazo
La prueba es siempre de cola derecha. Buscar el valor crítico χ²α en la tabla con los df calculados. Región de rechazo: [χ²α, ∞).
05
Tomar la decisión y concluir
Si χ²calculado > χ²crítico → Rechazar H₀ (hay evidencia de dependencia). Si χ²calculado ≤ χ²crítico → No rechazar H₀. Siempre concluir en el contexto del problema.
Nota importante
El mismo procedimiento de 5 pasos funciona para la prueba de bondad de ajuste; solo cambia la fórmula de df (I−1 en lugar de (I−1)×(J−1)).
💡
Slide 07 · Ejemplo Completo
Ejemplo: CEE vs GPA — Independencia
Contexto del problema
Un investigador quiere saber si los puntajes de un examen de admisión universitaria (CEE) predicen el rendimiento académico (GPA). Selecciona n=100 estudiantes. α = 1%.
Tabla de contingencia
CEEGPA <2.7GPA 2.7-3.2GPA >3.2Total
<1800
O=35
E=21.32
O=12
E=18.72
O=5
E=11.96
52
≥1800
O=6
E=19.68
O=24
E=17.28
O=18
E=11.04
48
Total413623100
Resolución paso a paso
Paso 1 — Hipótesis
H₀: CEE y GPA son independientes
Ha: CEE y GPA NO son independientes
Paso 2 — Distribución
Distribución χ² · I=2, J=3 → df=(2−1)×(3−1)=2
Paso 3 — Estadístico
χ² = (35−21.32)²/21.32 + … = 31.75
Paso 4 — Región de rechazo
χ²₀.₀₁ con df=2 → valor crítico = 9.210
Región: [9.210, ∞)
Paso 5 — Decisión
31.75 > 9.210 → Rechazar H₀
Conclusión: el CEE sí predice el GPA al 1% de significancia.
🎲
Slide 08 · Tema 4.6
Prueba de Bondad de Ajuste χ²
¿Qué prueba?
Verifica si una muestra proviene de una población con una distribución teórica específica. Se comparan frecuencias observadas contra las esperadas según la distribución asumida.
Fórmula de frecuencia esperada
Ei = n × pi n = tamaño de muestra · pᵢ = probabilidad teórica
df = I − 1 I = número de categorías
Hipótesis
H₀: La distribución asumida para X es válida
Ha: La distribución asumida para X no es válida
Ejemplo: ¿El dado es justo?
n = 60 lanzamientos · pᵢ = 1/6 para cada cara
Frecuencia esperada por cara: E = 60 × 1/6 = 10
CaraObservado (O)Esperado (E)(O−E)²/E
19100.10
215102.50
39100.10
48100.40
56101.60
613100.90
χ² = 5.60 · df = 5 · χ²₀.₁₀ = 9.236
5.60 < 9.236 → No rechazar H₀ · El dado parece justo.
📊
Slide 09 · Resumen Comparativo
Independencia vs. Bondad de Ajuste
Comparativa de las dos pruebas χ²
AspectoPrueba de IndependenciaBondad de Ajuste
¿Qué prueba?Si dos factores son independientesSi una muestra sigue distribución teórica
DatosTabla de contingencia I×JFrecuencias de I categorías
E se calculaE = (R×C)/nE = n × pᵢ
df(I−1)×(J−1)I−1
Estadísticoχ² = Σ(O−E)²/Eχ² = Σ(O−E)²/E
Tipo de colaDerecha (unilateral)Derecha (unilateral)
Condición EToda E ≥ 5Toda E ≥ 5
EjemploCEE vs GPA, género vs FCDado justo, distribución étnica
🔗
Independencia
Dos variables categóricas. Tabla I×J. df=(I−1)(J−1). Pregunta: ¿se relacionan?
Bondad de ajuste
Una variable. I categorías. df=I−1. Pregunta: ¿la muestra sigue esta distribución?
⚠️
Siempre
Misma fórmula χ²=Σ(O−E)²/E. Siempre cola derecha. Siempre E≥5 en cada celda.
🌸
Slide 10 · Ejercicio Práctico
¡A practicar! Preguntas de repaso
PREGUNTA 1 Distribución χ²
Una tabla de contingencia 3×4 se usa en una prueba χ² de independencia. ¿Cuántos grados de libertad tiene el estadístico?
  • A 12
  • B 6 ✓ — df = (3−1)×(4−1) = 2×3 = 6
  • C 7
  • D 11
PREGUNTA 2 Frecuencia Esperada
En una tabla de contingencia, una celda tiene total fila R=40, total columna C=30 y n=150. ¿Cuál es su frecuencia esperada E?
  • A 12
  • B 8 ✓ — E = (40×30)/150 = 1200/150 = 8
  • C 70
  • D 5
PREGUNTA 3 Decisión Estadística
En una prueba χ² de bondad de ajuste con df=5 y α=0.05, el valor calculado es χ²=11.07. El valor crítico es 11.071. ¿Cuál es la decisión correcta?
  • A No rechazar H₀ porque χ²calc < χ²crítico
  • B Rechazar H₀ porque χ²calc ≥ χ²crítico ✓
  • C Nunca se rechaza con df=5
  • D La prueba es bilateral
📝
Slide 11 · Actividad Evaluable
Actividad: Prueba χ² de Independencia
⚡ Instrucciones generales
Aplica la prueba χ² de independencia al caso asignado, siguiendo los 5 pasos completos. Muestra todos los cálculos. Trabajo en parejas. Tiempo: 25 minutos en clase + entrega escrita.
1️⃣
Plantear las hipótesis

Escribe H₀ y Ha en palabras relacionadas con el problema. Indica el nivel de significancia α que usarás (elige entre 5% o 1%). Justifica tu elección.

2️⃣
Construir la tabla y calcular E

Con los datos del caso: organiza la tabla de contingencia, calcula todas las frecuencias esperadas E=(R×C)/n y verifica que cada E ≥ 5. Calcula los df.

3️⃣
Calcular χ² y tomar la decisión

Calcula el estadístico χ²=Σ(O−E)²/E, busca el valor crítico en la tabla, define la región de rechazo e indica claramente si rechazas o no H₀ con su conclusión en contexto.

Criterios de evaluación
  • Hipótesis correctamente planteadas
  • Tabla de contingencia completa (O y E)
  • Cálculo correcto de df y χ²
  • Decisión justificada con valor crítico
  • Conclusión en el contexto del problema
Caso asignado (datos del caso)

Una encuesta a 200 estudiantes clasifica su tipo de dieta (vegetariana / mixta) y su nivel de actividad física (bajo / medio / alto). Los datos se distribuyen en la tabla que el docente entregará en hoja aparte. Determina si existe asociación entre dieta y actividad física.

📚
Slide 12 · Recursos y Bibliografía
Fuentes y Material de Apoyo
Bibliografía principal
📖
Introductory Statistics — Saylor Foundation
Capítulo 11: Chi-Square Tests and F-Tests. Secciones 11.1 (independencia) y 11.2 (bondad de ajuste). Incluye ejemplos paso a paso y tablas de valores críticos.
https://saylordotorg.github.io/text_introductory-statistics/s15-chi-square-tests-and-f-tests.html
🏫
Conceptos Básicos de Estadística — UNAM
Material de apoyo sobre pruebas de hipótesis y distribuciones de muestreo. Ideal para reforzar los fundamentos teóricos de la distribución χ².
https://www.paginaspersonales.unam.mx/files/977/Conceptos_basicos_de_estadistica.pdf
Recursos complementarios
🧮
Calculadora χ² en línea
Herramienta interactiva para ingresar tablas de contingencia y obtener χ² calculado, df y p-valor automáticamente. Útil para verificar resultados.
socscistatistics.com/tests/chisquare
🎬
Khan Academy — Prueba χ²
Videos explicativos paso a paso sobre tablas de contingencia, cálculo del estadístico y toma de decisión en la prueba Ji-Cuadrada.
khanacademy.org/math/statistics-probability/inference-categorical-data-chi-square-tests
✅ Clase 2 — Completada

Resumen de lo aprendido

Distribución χ²
Solo valores ≥ 0 · asimétrica positiva · familia por df · cola derecha
Tabla contingencia
Organiza conteos de 2 factores · E = (R×C)/n · condición E ≥ 5
Estadístico
χ² = Σ(O−E)²/E · mide desviación observado vs esperado
Independencia
df = (I−1)(J−1) · H₀: independencia · rechazar si χ² > χ²crítico
Bondad de ajuste
E = n·pᵢ · df = I−1 · prueba si muestra sigue dist. teórica
5 pasos
Hipótesis → dist./condición → estadístico → región → decisión
χ² Dist. Ji-Cuadrada (4.6) 🔗 Independencia ✅ Bondad de ajuste

Unidad 4 — Bioestadística Aplicada 🌸